AI产业链地图·知识库 NVIDIA H200 · 概念
🚧 网站建设中 更新 2026·06·17 → 产业链图谱
首页/概念/NVIDIA H200
更新 2026·06·17
概念 技术 / 术语

NVIDIA H200

H200 · Hopper H200 · H200 SXM

H200 不是新架构,而是显存升级版 H100 —— 对训练性能提升有限(同等算力),但对推理大模型长上下文应用至关重要:

NVIDIA H200 CONCEPT · 概念
首次提出
2023
关键参与方
[[NVIDIA]] · [[CoreWeave]] · [[Microsoft Azure]]
反向引用
16 处 · 来自 7
归属 GPUAI芯片NVIDIA数据中心Hopper第二层

NVIDIA H200

NVIDIA Hopper 架构升级版数据中心 GPU(2023-11 发布,2024-Q2 出货),算力与 NVIDIA H100 同代,但显存升级至 141GB HBM3E、带宽提升至 4.8 TB/s,专为大模型推理和长上下文场景优化,承接 H100 → NVIDIA B200 之间的过渡市场。

关键规格

维度 数值
架构 Hopper(与 H100 同核)
发布 2023-11(SC23)/ 2024-Q2 量产
制程 TSMC 4N
显存 141 GB HBM3E(vs H100 的 80GB HBM3)
显存带宽 4.8 TB/s(vs H100 的 3.35 TB/s)
FP16 / BF16 ~989 TFLOPS(与 H100 一致)
FP8 ~1,979 TFLOPS
TDP 700W(SXM5)
互联 NVLink 4(900 GB/s)+ PCIe Gen5
整机形态 HGX H200 8 卡 / DGX H200

市场定位

H200 不是新架构,而是显存升级版 H100 —— 对训练性能提升有限(同等算力),但对推理大模型长上下文应用至关重要:

  • 70B+ 模型推理单卡可装,无需切分到多卡(vs H100 需 2 卡)
  • KV cache 容量翻倍,长 context(128K+)推理吞吐显著提升
  • 显存带宽提升 43% → 内存带宽瓶颈型负载性能直接收益

主要竞品:AMD MI300X(192GB HBM3,显存更大但 ROCm 生态弱)、Google TPU v5p(内部使用)。

客户与部署

演进路线

NVIDIA H100H200(显存升级)→ NVIDIA B200(新架构 Blackwell) → NVIDIA B300

关键来源

关联

↑ up::2-01-核心逻辑芯片 CoWoS HBM3E ↓ down::3-01-云计算与智算平台 3-02-AI算力租赁-智算服务 4-04-模型部署与优化 ⚔ competitor::AMD MI300X AMD MI325X ∈ belongs_to::2-01-核心逻辑芯片